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Implementa DevOps para tu canalización de machine learning 


Si eres un científico de datos o ingeniero de machine learning (ML), Azure Machine Learning 
está pensado para ti. Tiene MLOps integrado, lo que facilita la implementación de DevOps para 
el machine learning a través de un soporte integral de todas las fases del ciclo de vida de ML. 


Con todo lo que proporciona Azure Machine Learning, ya no te verás obligado a trabajar 
de un modo ineficiente ni a estar sobrecargado de tareas cotidianas. En su lugar, tendrás 

los medios para racionalizar y automatizar el ciclo de vida de ML integral y vincularlo a los 
procesos DevOps existentes, de modo que puedas colaborar con los desarrolladores de 
aplicaciones y trabajar con la misma cadencia a la hora de crear aplicaciones dotadas de ML. 


Quién debe leer este documento 

Escribimos este documento para profesionales del ML que buscan una mejor manera de 

trabajar, con acceso a los mismos tipos de herramientas sofisticadas y prácticas de ingeniería 
racionalizadas que dan por sentado los desarrolladores que trabajan en un entorno moderno de 
DevOps. Comenzamos examinando los flujos de trabajo de ML existentes, incluidos algunos de 
los principales vacíos de cobertura desde una perspectiva de las herramientas y la automatización. 
A continuación, presentamos MLOps y lo que se necesita para su uso. Después, exploramos cómo 
las características y capacidades de Azure Machine Learning se corresponden con los ciclos de 
vida de MLOps y DevOps. Por último, ofrecemos una guía rápida para comenzar a usar Azure 
Machine Learning y explorar todas las formas en que puede hacer que seas más productivo. 


Para empezar a usar Azure Machine Learning, necesitarás una cuenta de Azure. Si aún 
no tienes una suscripción a Azure, puedes crear una gratis y aprovechar un crédito de 
200 USD que puedes gastar durante los primeros 30 días. 


1. Vea la página Cuenta gratuita de Azure Machine Learning y selecciona Empieza gratis. 

2. Inicia sesión con tu cuenta Microsoft (o GitHub). Si todavía no tienes una cuenta 

Microsoft, podrás crear una. 

Rellena tu nombre, número de teléfono y dirección de correo electrónico. 

4. Verifica tu identidad con un código de texto y la información de la tarjeta de crédito. 
(No realizaremos ningún cargo en tu tarjeta hasta que haya finalizado la prueba y estés 
listo para elegir un plan de suscripción). 


go 


Después de seleccionar Continuar, podrás empezar a trabajar con Azure Machine Learning. 
Haznos saber si tienes alguna pregunta. 
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Introducción 


Si trabajas con código, es probable que hayas oído hablar de DevOps. Se trata de un enfoque 
para la administración del ciclo de vida de la aplicación que emplea una canalización (idealmente, 
completamente automatizada) de integración e implementación continuas (Cl/CD) para agilizar 
el proceso de creación, prueba e implementación de nuevo código en un entorno de producción. 
Esto proporciona varias ventajas, desde una forma más fácil de trabajar para los desarrolladores 
de aplicaciones hasta una operativización más rápida y eficiente del nuevo código, todo lo cual 
contribuye a la entrega acelerada de valor de negocio. 


Si bien los objetivos de DevOps han permanecido inalterados en los últimos años, los medios para 
alcanzarlos han evolucionado para dar soporte a las nuevas tecnologías. Las aplicaciones basadas en 
el cloud y la creación de contenedores son dos buenos ejemplos. Pero ¿qué sucede con el machine 
learning (ML), que desempeña un papel cada vez más importante en las aplicaciones modernas? Los 
sistemas de recomendación, los clasificadores de imágenes, los escáneres de reconocimiento facial, 
los canales de detección de fraudes para clics publicitarios y los servicios de traducción de voz a texto 
son buenos ejemplos de escenarios dotados de ML. Están habilitados por los científicos de datos 
que crean y validan los modelos de ML y por los ingenieros de ML que empaquetan, implementan 

y ejecutan esos modelos. Sin embargo, estas mismas personas en contadas ocasiones tienen 

acceso a las herramientas sofisticadas y a las prácticas de ingeniería estandarizadas y racionalizadas 
que dan por sentado los desarrolladores que trabajan en un entorno moderno de DevOps. 


El resultado es que los científicos de datos y los ingenieros de ML suelen trabajar de manera 
ineficiente y están sobrecargados con tareas manuales, como las transferencias de datos a los 
desarrolladores en cuyas aplicaciones, en última instancia, se ejecutarán sus modelos de ML. Esto 
supone un impedimento para utilizar los modelos de ML con la misma cadencia, y en los mismos 
procesos de DevOps, que la aplicación, lo que, finalmente, ralentiza la entrega de aplicaciones 
habilitadas para ML y reduce la rentabilidad empresarial de la inversión en dichas soluciones. 


En el resto de este documento: 
* Examinaremos los flujos de trabajo de ML existentes, incluidos algunos de los principales 
vacíos de cobertura desde una perspectiva de las herramientas y la automatización. 


e  Presentaremos MLOps, una estructura que introduce a los científicos de datos e ingenieros 
de ML en el mundo moderno de DevOps, y lo que se necesita para su uso. 


e —Analizaremos cómo Azure Machine Learning ofrece esta visión de MLOps, incluida 
una explicación de sus capacidades clave y cómo se corresponden con los ciclos 
de vida completos de ML y DevOps. 
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Planteamiento 
del desafío 


DevOps es la forma estándar de administrar los ciclos 
de vida de la aplicación a través de una canalización 

de herramientas de control de versiones, pruebas, 
compilación e implementación. En el mejor de los 
casos, se trata de una canalización de Cl/CD totalmente 
automatizada: desde el ingeniero de software que envía 
el código al control central de versiones (habitualmente 
un repositorio Git) hasta la compilación, prueba e 
implementación en un entorno de producción. 


Entonces, ¿cómo podría ser una solución de Cl/CD similar 

para ML? Requeriría canalizaciones para la automatización, la 
validación de la funcionalidad y el rendimiento de los modelos 
y el soporte para la implementación en la infraestructura 
empleada para la inferencia. Esto resulta especialmente difícil 
cuando los datos cambian con el tiempo y los modelos se 
deben reentrenar periódicamente, como sucede en el caso en 
muchos sistemas a gran escala dotados de ML. La complejidad 
crece aún más a medida que los modelos se implementan en 
un híbrido de perímetro inteligente más cloud inteligente. 


Sin embargo, debido a que el campo de ML es joven en 
comparación con el desarrollo de software tradicional, 
los procedimientos recomendados y soluciones en torno 
a la administración del ciclo de vida de ML aún no se han 
solidificado. El desarrollo del modelo se suele realizar en 
el portátil del científico de datos, tal vez en un bloc de 
notas de Jupyter u otra herramienta, y la coordinación 
se suele efectuar de forma manual o ad hoc, utilizando 
código y scripts personalizados, como sucedía en el 
desarrollo de aplicaciones tradicionales antes de que 
surgieran los procedimientos recomendados de DevOps. 
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Cómo funcionan las cosas hoy en día 


Los equipos de DevOps se esfuerzan en automatizar todos sus flujos de trabajo y ya lo hacen 
hoy en día en su mayor parte. Pero los científicos de datos tienden a estar en un silo fuera de 
la automatización, lo que supone un impedimento para usar modelos de ML con la misma 
cadencia, y en los mismos procesos de DevOps, que los desarrolladores de aplicaciones, 

que tienen prácticas bien establecidas para compilar, probar y enviar sus aplicaciones. 


Para los desarrolladores, el proceso comienza con la escritura de código, que se registra en el front- 
end de la canalización de DevOps. Los científicos de datos, por otro lado, tienden a hacer mucha más 
experimentación desde el principio. Dedican mucho tiempo modelando datos, averiguando qué 
características son más relevantes para su escenario, determinando qué algoritmo es el mejor para 
resolver su problema y afinando los hiperparámetros asociados. Solo después de haber encontrado 
la receta correcta para todo esto están listos para entrenar su modelo de ML, el primer paso en la 
canalización de ML que hemos definido. (Y aunque está fuera del alcance de este documento, hay 
una buena cantidad de trabajo que realizan adelante los ingenieros de datos, quienes suelen limpiar 
y estandarizar los datos, además de trabajar con ellos, antes de entregarlos al científico de datos). 


Después de que el científico de datos cree un modelo ML viable, es cuando suele comenzar 

a interactuar con un desarrollador para la integración de ese modelo en una aplicación. Típicamente, 
esto se lleva a cabo a través de la integración manual, o compartiendo interfaces básicas. Los 

costes de integración pueden aumentar si es necesario reescribir el código de características para 
que funcione con la pila de inferencias, si hay discrepancias entre los datos disponibles durante la 
formación y la inferencia, etc. 


Entonces, ¿qué falta? 
Hoy en día, así es cómo funciona el proceso. Ahora vamos a examinar dónde comienza a fallar. 


En primer lugar, se necesita el control del código fuente como medio para permitir la colaboración 
con otros científicos de datos, además de hacerlo con los desarrolladores. Para garantizar la 
reproducibilidad, es fundamental que todos los artefactos utilizados que se usan para generar 
modelos de ML (incluido el código de entrenamiento y los datos de entrada) se capturen a través del 
control del código fuente. Esto es importante porque hay muchos escenarios en los que los modelos 
se deben reentrenar y redistribuir, por ejemplo, cuando el modelo depende de datos de series 
temporales o de un conjunto específico de señales de entrada que pueden cambiar con el tiempo. 


A continuación, necesitas un canal de entrenamiento reproducible para agilizar el desarrollo 
de modelos mediante la automatización de las tareas repetitivas. La automatización, a su vez, 
aumentará la velocidad a la que se generan los nuevos modelos, lo que crea la necesidad 

de almacenar los modelos y crear versiones de los mismos. Y debes hacer esto de una 
manera que facilite su descubrimiento, el uso compartido y la colaboración. También necesitas 
el control de acceso y la trazabilidad para poder controlar quién tiene acceso a cada elemento 
(y saber quién lo usó). 
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Una vez que tengas el modelo que deseas, deberás abordar el empaquetado del modelo, lo 

que implica capturar las dependencias necesarias para que el modelo se ejecute en su entorno de 
inferencia de destino. La creación de contenedores es la elección evidente; los contenedores son la 
unidad de ejecución de facto en la actualidad, tanto en el cloud como en el perímetro inteligente. 
También deberás tener en cuenta los formatos de modelo que son independientes de la estructura 
de entrenamiento y de servicio, que es donde pueden ser útiles los formatos reutilizables, como 
Open Neural Network Exchange (ONNX). 


A continuación, deberás ocuparte de la validación del modelo. Esta validación puede ser tan simple 
como pruebas básicas de unidad para el código de entrenamiento, una comparación A/B con respecto 
a Una versión anterior de un modelo, o una serie de pruebas funcionales y de rendimiento integrales. 


Cuando los modelos son reproducibles en una canalización automatizada, se han solidificado 
el almacenamiento de modelos y el control de versiones y se han aplicado los métodos de 
empaquetado y validación, dispondrás de una canalización integral que puede admitir la 
implementación de nuevos modelos en diferentes plataformas en todos los escenarios. 


Por último, necesitarás la capacidad de supervisar tus modelos en un entorno de producción, 
como medio para comprender qué datos se están enviando a tu modelo y las predicciones que 
este devuelve. También debes supervisar el cambio de los datos entre tu conjunto de datos de 
entrenamiento y los datos de inferencia, de modo que sepas si tu modelo se debe reentrenar, 
y cuándo, así como el modo de reintroducirlo en tu canalización automatizada. 


El estado deseado 


El ciclo de vida de ML integral descrito anteriormente se parece al que se muestra en la figura 1. En 
empresas grandes, un científico de datos puede ser el dueño de los primeros pasos y un ingeniero 
de ML puede serlo del resto. En las empresas pequeñas, un científico de datos podría ser el dueño 
de todos los pasos. En aras de la simplicidad, en el resto de este documento, los atribuimos todos al 
científico de datos. 


Entrenar modelo Empaquetar modelo Validar modelo Implementar modelo Supervisar modelo 


Conservar modelo 


Figura 1. El ciclo de vida de ML integral. 
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MLOps: un 
enfoque de 
ciclo de vida 


MLOps, una tendencia relativamente nueva en la industria, 
está intentando hacer para los científicos de datos e ingenieros 
de ML lo que DevOps hace para los desarrolladores. No es un 
producto o servicio, sino un concepto o una forma de trabajar. 
Se podría describir como un enfoque para racionalizar el 

ciclo de vida integral de ML, de manera que se vincule a los 
procesos y herramientas existentes de DevOps, para que los 
científicos de datos, los ingenieros de ML y los desarrolladores 
de aplicaciones puedan colaborar eficazmente y trabajar con 
la misma cadencia para ofrecer aplicaciones dotadas de ML. 


Esa es una descripción bastante precisa, pero también es 
ambiciosa. Por lo tanto, vamos a realizar un análisis más 
exhaustivo y examinar lo que debe proporcionar exactamente 
un enfoque de MLOps. ¿Qué capacidades se necesitan? 
¿Pueden utilizarse los procesos y herramientas de DevOps 
existentes para entregarlas? Si es así, ¿hasta qué punto? ¿Y qué 
lagunas de cobertura quedan? 


MLOps: un enfoque de ciclo de vida 10 


Para responder a estas preguntas, empecemos por analizar los requisitos clave que hemos 
identificado en negrita en la sección Entonces, ¿qué falta? Como recordatorio, incluyen: 


Control del origen del modelo y capacidad de reproducibilidad: procesos y procedimientos 
para que los modelos se puedan reproducir (desde el control del origen hasta las políticas de 
retención de datos). 


Control de versiones y almacenamiento de modelos: facilitar el intercambio, la colaboración 
y la reutilización de modelos en un entorno que incluye un control de acceso y una trazabilidad 
exhaustivos. 


Empaquetado de modelos: como el uso de la creación de contenedores para capturar 
todas las dependencias y el uso de ONNX para la interoperabilidad de modelos y la 
reutilización a través de diferentes pilas de inferencia. 


Validación de modelos: pruebas de unidades, pruebas funcionales y pruebas de rendimiento 
(tanto de forma aislada como cuando se incorporan en una aplicación). 


Implementación de modelos: un proceso eficiente para crear un modelo en una aplicación 
o servicio, según sea necesario para habilitar un escenario de usuario final. 


Reentrenamiento continuo: como medio para gestionar los numerosos escenarios en los 
que los modelos se deben reentrenar según la disponibilidad de nuevos datos, datos en 
continua evolución u otras señales. 


En las siguientes páginas, examinaremos más de cerca cada uno de estos requisitos clave. Por 
supuesto, también necesitarás considerar elementos fundamentales, como la compatibilidad con 
lenguajes y marcos comunes. 


Para empezar a usar Azure Machine Learning, necesitarás una cuenta de Azure. Si aún 
no tienes una suscripción a Azure, puedes crear una gratis y aprovechar un crédito de 
200 USD que puedes gastar durante los primeros 30 días. 


1. Vea la página Cuenta gratuita de Azure Machine Learning y selecciona Empieza gratis. 
2. Inicia sesión con tu cuenta Microsoft (o GitHub). Si todavía no tienes una cuenta 


Microsoft, podrás crear una. 

Rellena tu nombre, número de teléfono y dirección de correo electrónico. 

4. Verifica tu identidad con un código de texto y la información de la tarjeta de crédito. 
(No realizaremos ningún cargo en tu tarjeta hasta que haya finalizado la prueba y estés 
listo para elegir un plan de suscripción). 


ES 


Después de seleccionar Continuar, podrás empezar a trabajar con Azure Machine Learning. 
Haznos saber si tienes alguna pregunta. 
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Control del código fuente y reproducibilidad 


Aunque muchos científicos de datos comienzan el desarrollo del modelo en un bloc de notas u otro 
entorno que no requiere el uso de control del código fuente, todavía puede ser útil en las primeras 
fases para la reutilización y la colaboración. Cuando no se utiliza el control de código fuente, pueden 
surgir varios problemas: 


e Los modelos no se pueden reproducir, ni existe ninguna trazabilidad de cómo se produjeron 
inicialmente. 


e Los mandatos de gestión y cumplimiento son más difíciles de cumplir. 
e Los equipos no pueden colaborar entre modelos. 

+ El código fuente se estructura de forma diferente para cada modelo. 
e Los científicos de datos no pueden clonar ni entrenar modelos. 


e Es más difícil para los desarrolladores de aplicaciones averiguar cómo funciona un modelo 
y cómo usarlo. 


Estos son solo algunos de los motivos por los que el control del código fuente es un primer paso 
necesario, un requisito previo para la reproducibilidad del modelo, la colaboración, la automatización, 
la trazabilidad y mucho más. Si no captura el código de entrenamiento ni los datos de entrada 
utilizados para generar un modelo, nunca podrá efectuar el seguimiento con precisión de qué 
entradas produjeron la salida de un modelo que está utilizando en la producción. Por supuesto, 

aquí se puede producir un delicado equilibrio, especialmente cuando se trata de mandatos de 
cumplimiento como el Reglamento general de protección de datos de la UE: aunque se quiere 
asegurar la reproducibilidad al conservar los datos durante largos períodos de tiempo, también 

es necesario dar a los clientes el control de sus datos, incluida la posibilidad de eliminarlos. 


Control de versiones y almacenamiento 


A medida que el ciclo de vida del desarrollo del modelo comienza a madurar y un número cada 
vez mayor de científicos de datos producen más modelos, aumenta la necesidad de un control de 
versiones y almacenamiento de modelos efectivos. Sin ello: 


e Compartir, colaborar y reutilizar resultan más difíciles. Sin un sistema centralizado para 
registrar todos los modelos, facilitar las búsquedas y permitir a los ingenieros implementarlos 
como microservicios, las organizaciones suelen encontrarse con que algunos equipos están 
duplicando esfuerzos mientras que otros equipos necesitan un modelo pero no tienen los 
recursos para desarrollarlo. 


+. No puedes controlar quién tiene acceso a cada elemento (ni saber quién lo usó). Poner 
la propiedad intelectual de una organización a disposición de cualquier persona de la empresa 
es una mala gestión de Tl, por lo que las soluciones para el almacenamiento de modelos 
deben incorporar el control de acceso. Se deberían incluir formas de administrar quién puede 
proporcionar los modelos y quién puede acceder a ellos, además de una completa trazabilidad, 
de modo que siempre puedas determinar quién proporcionó o quién accedió a cada elemento. 
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Existen varias estrategias para el control de versiones del modelo. Dependiendo de su tamaño 
(por ejemplo, al comparar los clasificadores de ML tradicionales con las redes de aprendizaje 
profundo), los modelos se pueden insertar directamente en el control del código fuente 

O almacenarse en una fuente de paquetes con versión. Independientemente del método que 
use, vale la pena recordar que los equipos maduros quieren modelos validados y reutilizables. 
Para respaldar esta situación, el control de versiones del modelo debe incorporar el historial 
de los experimentos de alguna manera, ya sea que capturado en un bloc de notas, en un 
control de código fuente o en una base de datos central. Dichos experimentos pueden 
proceder de diferentes ubicaciones de código fuente, como un SDK, un IDE o un trabajo de 
Cl. Todos son válidos para efectuar el seguimiento. Lo ideal sería capturar tanto la información 
sobre el modelo en sí como sobre su precisión relativa para un escenario específico. 


Además, debes tener en cuenta la interoperabilidad de los modelos como un medio para facilitar 

a los científicos de datos la experimentación con una amplia gama de herramientas flexibles y, en 
última instancia, para que las nuevas ideas entren en producción más rápidamente. Un lenguaje 
intermedio y en varios marcos para almacenar modelos (como ONNX) puede facilitar la reutilización 
de los modelos en diferentes pilas de inferencia y permitir el cambio de marcos en el proceso de 
entrenamiento sin necesidad de reescribir masivamente el código en el lado de la inferencia. 


Empaquetado 


Para poner un modelo en uso, tendrás que empaquetarlo para tu entorno de inferencia de 
destino. Los contenedores constituyen una elección lógica porque son la unidad de ejecución 
predeterminada tanto en los entornos de cloud modernos como en el perímetro inteligente. Los 
contenedores también proporcionan una forma fácil de capturar las dependencias de tiempo de 
ejecución, incluidos los entornos Conda, bibliotecas con versiones de Python y otras bibliotecas 
a las que el modelo puede hacer referencia. Todos estos elementos son necesarios para que el 
modelo se ejecute correctamente. 


Al empaquetar el modelo, también puedes tener en cuenta formatos abiertos, como Open Neural 
Network Exchange (ONNX), que pueden ayudarte a optimizar el rendimiento durante la inferencia. 
ONNX también te permite entrenar un modelo en un entorno, con tu conjunto de herramientas 
preferidas, y, después, implementarlo en otro entorno para la inferencia y la predicción. PyTorch, 
MXNet, Caffe2 y otros marcos populares admiten ONNX de forma nativa, y hay convertidores para 
otros marcos como TensorFlow, Core ML y scikit-learn. ONNX también es compatible con varios 
tiempos de ejecución, compiladores y visualizadores. (Puedes encontrar una lista completa de todas 
las herramientas que admiten ONNX aquí). 
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Validación 


Se necesita un medio eficiente de validación de modelos para entrenar los modelos de forma 
continua, garantizar la calidad y, en última instancia, evitar que los modelos deficientes lleguen 

a la producción. Además de cumplir con la funcionalidad y los requisitos de rendimiento deseados, 
un modelo no debe fallar ni provocar errores cuando se carga o cuando se envían entradas erróneas 
o inesperadas. Finalmente, no debe utilizar demasiados recursos del sistema. 


Idealmente, la validación del modelo tiene dos partes: pruebas unitarias y de integración del propio 
modelo, y pruebas funcionales y de rendimiento del modelo como insertado en una aplicación 

o servicio. Por ejemplo, si entrenas un modelo con un formato de datos de entrada diferente del 
que está disponible para el servicio de inferencia, podría funcionar bien durante el proceso de 
entrenamiento pero tener un rendimiento deficiente en la producción. 


e Prueba del modelo. Las pruebas unitarias y de integración tradicionales que se ejecutan 
en un pequeño conjunto de entradas deben producir resultados estables. Cabe señalar que, 
a diferencia de una aplicación tradicional (sin ML), serán resultados estadísticos, es decir, 
habrá un rango de valores aceptables (un destino previsto y su evolución) en vez de un 
criterio de aprobación finito. Esto también puede implicar la prueba de los datos empleados 
para producir el modelo, según sea necesario para garantizar que coincida con lo que estará 
disponible durante el escenario de puntuación en términos de esquema y características. 


+. Prueba conjunta de la aplicación y el modelo. Debes asegurarte de que tu modelo se 
comporta correctamente en el contexto de tu aplicación completa, lo que puedes hacer 
utilizando una versión existente de la aplicación (o una variante de ella) para ejecutar las 
partes relevantes del conjunto de pruebas de la propia aplicación de host. Dichas pruebas 
también pueden contribuir a garantizar que los esquemas de datos (entrada/salida) y los 
comportamientos para todos los casos base en una aplicación estén suficientemente cubiertos. 
A medida que maduran, la mayoría de las organizaciones construyen una pila personalizada para 
este nivel de validación del modelo. 


Implementación 


Cuando se trata de la colaboración entre los científicos de datos y los desarrolladores de 
aplicaciones, uno de los puntos más difíciles es el proceso de implementación del modelo. Entre 

los problemas típicos se incluyen la dificultad de introducir el modelo en una aplicación o servicio, 

la falta de mecanismos para evitar el envío de una regresión funcional o de rendimiento y el 
prolongado tiempo (y esfuerzo manual) asociado a los procesos de puesta en marcha y lanzamiento. 


Al optimizar la implementación del modelo, darás más tiempo a los científicos de datos para 
centrarse en las tareas de modelado y a los desarrolladores para trabajar en otros aspectos de sus 
aplicaciones. Para ello, necesitarás procedimientos recomendados con los que los modelos sean 
fáciles de implementar, con calidad y seguridad, en una amplia variedad de destinos de inferencia. 
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Analicemos esto con más detalle, comenzando con el destino de un modelo, que podría ser: 


*  Implementarse como un servicio de inferencia independiente y en contenedor. 
+ Usarse como parte de una canalización de procesamiento por lotes. 


e  Insertarse en una aplicación o servicio existente. 


Aunque la unidad de implementación puede variar, el objetivo sigue siendo el mismo: hacer que la 
creación y el lanzamiento de esa unidad de implementación sea lo más simple, rápida y eficiente 
posible. Para lograrlo, una solución óptima para la implementación del modelo debe tener interfaces 
de usuario simples que faciliten a los ingenieros la implementación y la supervisión de los modelos, 
con una mínima configuración adicional. También debería ayudar a los usuarios con distintos niveles 
de experiencia en ML a comprender y analizar sus datos y modelos. 


Algunas cosas que pueden facilitar la implementación del modelo son: 


e Proporcionar un formato de modelo fácil de usar, como PNNL u ONNX. 


* Simplificar el proceso para interactuar con el modelo, por ejemplo, mediante la generación de 
código, las especificaciones de la API u otros métodos. 


e  Respaldar diferentes destinos de inferencia, entre los que se incluyen: cloud, aplicación, 
perímetro, hardware especializado como FPGA y marcos dedicados como Core ML y WinML. 


e Incorporar la administración de secretos y de puntos de conexión de servicio para simplificar 
la configuración. 


Incluso con todo lo anterior, la gestión del proceso de lanzamiento e implementación puede 
suponer una dificultad, por lo que también necesitarás controles de acceso total, verificaciones 
manuales y automatizadas, así como capacidad de auditoría integral, especialmente cuando se 
trata de problemas de cumplimiento de normas, datos de clientes o ambos. 


Reentrenamiento continuo 


Finalmente, debes establecer un bucle de reentrenamiento. La mayoría de las canalizaciones de 
entrenamiento se configuran como flujos de trabajo o gráficos de dependencias que ejecutan 
Operaciones o trabajos específicos en una secuencia definida: si un equipo necesita el entrenamiento 
de nuevos datos, el mismo flujo de trabajo o gráfico se puede volver a ejecutar. Muchos casos de uso 
reales requieren: 


e  Reentrenamiento basado en la disponibilidad de nuevos datos (donde el propio código de 
entrenamiento permanece estático). 


e  Reentrenamiento con datos en evolución (como una ventana móvil en los últimos n días de 
un flujo de registro). 


e  Reentrenamiento basado en otras señales (como el cambio de los datos). 


03 / 


Azure Machine 
Learning está 
preparado para 
MLOps 


Azure Machine Learning, un servicio en el cloud, tiene MLOps 
incorporado. Admite todas las fases del ciclo de vida del 
modelo de ML, con compatibilidad completa con conocidos 
paquetes Python de código abierto, como scikit-learn, 
TensorFlow, PyTorch y MXNet. 
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Con Azure Machine Learning, puedes: 


+ Convertir tu proceso de entrenamiento en un proceso reproducible. Usar canalizaciones 
de ML para unir todos los pasos del proceso de entrenamiento de modelos, desde la preparación 
de datos y la extracción de características hasta el ajuste de los hiperparámetros y la evaluación 
del modelo. 


e Registrar y realizar el seguimiento de tus modelos de ML. Usar el registro de modelos 
para almacenar tus modelos entrenados en tu propio espacio de trabajo, en el cloud de Azure, 
y crear versiones de ellos, facilitando su seguimiento y organización. 


+ Empaquetar y depurar modelos. Los modelos se empaquetan en una imagen de Docker antes 
de implementarlos. Puedes dejar que esto suceda automáticamente en el fondo o especificar 
manualmente la imagen. Si se produce algún problema, puedes realizar una implementación 
local para la solución de problemas y la depuración. 


+ Validar modelos y generar perfiles de ellos. Azure Machine Learning puede generar un perfil 
de tu modelo para determinar la configuración ideal de CPU y memoria para la implementación. 
La validación del modelo se realiza como parte de este proceso, utilizando los datos que se 
suministran para la generación de perfiles. 


e Convertir y optimizar los modelos. De media, la conversión del modelo al formato Open 
Neural Network Exchange (ONNX) puede duplicar el rendimiento. Puedes utilizar Azure 
Machine Learning para crear un nuevo modelo ONNX o convertir un modelo existente a ONNX. 


e Efectuar la implementación casi en cualquier lugar. Con Azure Machine Learning, 
puedes implementar tus modelos de ML como servicios web en el cloud, en tu entorno 
de desarrollo local o en dispositivos Azure loT Edge. Las implementaciones pueden utilizar 
la CPU, la GPU o las matrices de puertas programables (FPGA) para la inferencia. Incluso 


puedes insertar modelos de ML en aplicaciones de análisis basadas en Microsoft Power BI. 


+ Capturar un seguimiento de auditoría integral. Azure Machine Learning se integra con Git 
para realizar un seguimiento de la procedencia de tu código y con Azure ML Datasets para 
efectuar un seguimiento y crear versiones de tus datos. El historial de ejecución almacena 
una instantánea del código, los datos y los recursos de proceso utilizados para entrenar un 
modelo y el registro de modelos captura todos los metadatos asociados a tu modelo. 


e  Automatizar el ciclo de vida de ML integral. Con la extensión de Azure Machine Learning, 
puedes usar Azure Pipelines para permitir una integración continua, iniciando automáticamente 
una ejecución de entrenamiento al verificar un cambio en un repositorio Git. También puedes 
crear canalizaciones de lanzamiento que se activan cuando se crean nuevos modelos en una 
canalización de entrenamiento. 


En las siguientes páginas, profundizaremos en la forma en que Azure Machine Learning 
respalda los MLOps en cada fase del ciclo de vida de ML. O, si lo prefieres, puedes saltar 


a Empezar a usar Azure Machine Learning para explorar por tu cuenta. 


04 / Antes de profundizar en las capacidades específicas de 
Azure Machine Learning y en la forma en que habilitan 
MLOps, definamos qué es Azure Machine Learning: una 

Cómo fu ncion a colección administrada de servicios en el cloud para 
machine learning, que se ofrecen como un espacio de 
trabajo y un SDK. Azure Machine Learning se ha diseñado 
para mejorar la productividad de los científicos de 
datos que crean, entrenan e implementan modelos de 
machine learning a gran escala y de los ingenieros de 
ML que administran y automatizan las canalizaciones de 
machine learning, además de realizar su seguimiento. 


Si se profundiza un poco más, Azure Machine 
Learning consta de los siguientes componentes: 


e Un SDK que se conecta a cualquier IDE, bloc 
de notas o CLI basados en Python 

e Un entorno de proceso que puede admitir cargas de 
trabajo de cualquier escala y complejidad, lo que incluye la 
capacidad de escalado vertical y horizontal, el autoescalado 
incorporado y la flexibilidad de utilizar la infraestructura 
basada en CPU o GPU para el entrenamiento. 

e Un registro de modelos centralizado para realizar 
un seguimiento de los modelos y los experimentos, 
independientemente de dónde o cómo se creen. 

e Compatibilidad integrada con Azure Container 
Instances, Azure Kubernetes Service y Azure loT 
Hub para la implementación en contenedores de 
modelos en el cloud y el perímetro inteligente. 

e Un servicio de supervisión que captura las métricas de 
los modelos, y hace un seguimiento de ellos, que están 
registrados e implementados con Azure Machine Learning. 


Cómo funciona 18 


Ahora que hemos explicado esto, vamos a desglosar lo que Azure Machine Learning aporta 
a Cada fase del ciclo de vida de ML integral y cómo esas capacidades se incorporan al ciclo de 
vida tradicional de DevOps, como se muestra en la figura 2. 


Colaboración Crear aplicación Probar aplicación Lanzar aplicación Supervisar aplicación 


Figura 2. Flujo de trabajo y procesos típicos de DevOps. 


Desarrollador 
de aplicaciones 
con Azure DevOps 


En las siguientes páginas, utilizamos los nombres de Azure Machine Learning para las características 
y capacidades para que te sea más fácil familiarizarte con ellas. Y donde nuestra documentación 
completa online proporcione más información sobre un tema que la que tenemos espacio para 
explicar en este documento, proporcionamos un enlace a dicho artículo. 


Entrenar un modelo reproducible 


Con Azure Machine Learning, tendrás todo lo necesario para crear y entrenar un modelo 
reproducible de forma rápida y eficiente. 


Espacios de trabajo 

El espacio de trabajo, el recurso de nivel superior de Azure Machine Learning, proporciona un 
lugar centralizado para trabajar con todos los artefactos que se crean al utilizarlo. Puedes definir 
roles de usuario en tu espacio de trabajo, lo que te permite compartirlo con otros usuarios, 
equipos o proyectos. 


Un espacio de trabajo puede contener máquinas virtuales de bloc de notas, que están configuradas 
con el entorno Python necesario para ejecutar Azure Machine Learning. Puedes crear y ejecutar 
experimentos (las ejecuciones de entrenamiento que utilizas para crear tus modelos) mediante 

el SDK de Azure Machine Learning para Python, los experimentos de machine learning 
automatizados (preview) o el diseñador de Azure Machine Learning (preview). A medida que 

iteras, el espacio de trabajo mantiene un historial de todas las ejecuciones de entrenamiento 
(incluidos registros, métricas, resultados y una instantánea de tus scripts) para ayudarte a determinar 
qué ejecución produce el mejor modelo. Tu espacio de trabajo también es el lugar donde se 
definen los destinos de proceso que se utilizan para ejecutar los experimentos y donde se 

definen y administran los conjuntos de datos que se utilizarán para el entrenamiento de modelos 

y la creación de canalizaciones. 
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Administración de código, conjuntos de datos y entornos 

A medida que trabajes, tendrás que administrar y hacer un seguimiento de varias cosas, 
empezando por el código. Lo más probable es que esté en un repositorio Git. Azure 
Machine Learning incluye el seguimiento del repositorio Git: cada vez que envíes artefactos 
de código al servicio, puedes especificar una referencia del repositorio Git. Esto se hace 
automáticamente cuando se ejecuta desde una solución de Cl/CD como Azure Pipelines. 


También deberás definir y administrar los datos que utilizas para el entrenamiento del modelo. 
Los conjuntos de datos de Azure Machine Learning proporcionan un medio para crear versiones, 
perfiles e instantáneas de los datos, lo que te permite reproducir el proceso de entrenamiento 

al tener acceso a los mismos datos. También puedes comparar los perfiles de conjunto de datos 
para determinar cuánto han cambiado los datos o si necesitas volver a entrenar el modelo. 


Además, deberás configurar y administrar los destinos de proceso utilizados para ejecutar 
los experimentos, que es donde pueden ayudar los entornos de ML administrados por 
Azure Machine Learning. Se comparten en todo lo que puedes hacer con Azure Machine 
Learning, de modo que puedes utilizarlos para simplificar el traspaso del entrenamiento 

a la inferencia, o para reproducir un entorno de entrenamiento a nivel local. Los entornos 
proporcionan una administración y almacenamiento en caché automáticos de las 
imágenes de Docker, además de un seguimiento para garantizar la reproducibilidad. 


Canalizaciones de ML 

Puedes usar las canalizaciones de Azure Machine Learning para unir y agilizar todos los pasos del 
proceso de desarrollo del modelo, desde la preparación de datos y la extracción de características 
hasta el ajuste de los hiperparámetros, la evaluación del modelo y, finalmente, la implementación. 
Con el aprovechamiento de las canalizaciones, puedes optimizar los flujos de trabajo para obtener 
velocidad, portabilidad y reutilización, lo que te deja más tiempo para poner en práctica tu 
experiencia en ML. 


Las canalizaciones se construyen a partir de varios pasos, que son unidades de cálculo distintas. 
Cada paso se puede ejecutar de forma independiente y puede utilizar recursos de proceso aislados. 
Esto permite que varios científicos de datos trabajen en la misma canalización al mismo tiempo 

sin sobrecargar los recursos de proceso. También facilita el uso de diferentes entornos de proceso 
para cada paso. 


Después de diseñar una canalización, probablemente todavía tendrás que ajustar el bucle de 
entrenamiento en ella. Cuando se vuelve a ejecutar una canalización, la ejecución salta a los 
distintos pasos que se deben ejecutar de nuevo (como un script de entrenamiento actualizado) 

y se salta lo que no ha cambiado. Lo mismo se aplica a los scripts no modificados que se utilizan 
para la ejecución del paso. Todo esto puede ayudarte a evitar la repetición innecesaria de pasos 
costosos y que requieren mucho tiempo (como la ingesta y la transformación de datos) si los datos 
subyacentes no han cambiado. 
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Seguimiento y supervisión de los experimentos 
A medida que iteras para encontrar el mejor modelo, debes realizar un seguimiento de los 
experimentos y supervisarlos. El SDK de Azure Machine Learning para Python y la CLI de Azure 


Machine Learning proporcionan varios métodos para supervisar, organizar y administrar las 


ejecuciones para entrenamiento y experimentación. También puedes registrar las métricas 
de las ejecuciones de entrenamiento si añades código de registro al script de entrenamiento, 


envías una carrera de experimento, supervisas esa carrera e inspeccionas los resultados. Si 
utilizas MLflow, una biblioteca de código abierto para la administración de experimentos de ML, 
puedes utilizar MLflow Tracking con Azure Machine Learning. Además, puedes usar TensorBoard 


para inspeccionar y comprender la estructura y el rendimiento de los experimentos. 


Registro de modelos 

Después de tener un modelo que te guste, puedes guardarlo en el registro de modelos en tu espacio 
de trabajo, lo que facilita el almacenamiento, la versión, la organización y el seguimiento de todos 
tus modelos entrenados. Cada modelo registrado es un único contenedor lógico para uno o más 
archivos, de modo que, si tienes un modelo almacenado en varios archivos, puedes registrarlos 
como un único modelo en tu espacio de trabajo de Azure Machine Learning. Al descargar o 
implementar el modelo registrado, se incluirán todos los archivos que se hayan registrado. 


Los modelos registrados se identifican por nombre y versión; cuando registras un modelo con el 
mismo nombre que uno existente, el registro incrementa la versión. También puedes proporcionar 
metadatos adicionales para usarlos al buscar modelos. Puedes registrar modelos que se han 
entrenado fuera del servicio Azure Machine Learning y no puedes eliminar un modelo registrado 
que se esté utilizando en una implementación activa. 


En muchos sentidos, el registro de modelos constituye la base del proceso de administración 
del ciclo de vida de ML. Permite el control de versiones de los modelos, almacena las métricas 
de modelo, permite la implementación con un solo clic y realiza un seguimiento de todas las 
implementaciones de tus modelos, de modo que puedes actuar en caso de que un modelo 
se vuelva anticuado o su eficacia ya no sea aceptable. El registro de modelos también 
desempeña un papel en la activación de otras actividades en el ciclo de vida de ML, por 
ejemplo, cuando aparecen nuevos cambios o cuando las métricas superan un umbral. 


Ajuste automatizado del ML y los hiperparámetros 

El proceso de probar diferentes algoritmos y combinaciones de hiperparámetros 
hasta encontrar un modelo aceptable puede ser monótono para los científicos 
de datos. Aunque dicha iteración puede producir ganancias masivas en cuanto a 
la eficacia del modelo, impone costes en términos de tiempo y recursos. 


El ML automatizado en Azure Machine Learning utiliza conceptos del documento de 
investigación sobre factorización matricial probabilística para implementar una canalización 
automatizada y en paralelo, que prueba varios algoritmos y ajustes de hiperparámetros 
basados en la heurística de los datos y, después, presenta un conjunto de modelos que 
probablemente sean los más adecuados para el problema y el conjunto de datos dados. 
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ENTRADA PRUEBA INTELIGENTEMENTE VARIOS MODELOS EN PARALELO MODELO OPTIMIZADO 


Il 
Escribir datos 
Definir objetivos 
T% 
Aplicar restricciones 


Figura 3. El machine learning automatizado puede ayudar a encontrar los mejores 
modelos para un problema determinado y los modelos de conjuntos de datos para 
un problema y un conjunto de datos determinados. 


95 % 


El ML automatizado admite la clasificación, la regresión y la previsión. También incluye 
características para la gestión de los valores que faltan, la terminación anticipada por una métrica 

de parada, el bloqueo de algoritmos que no deseas explorar y otras optimizaciones. Además, su 
modo de interfaz de usuario (similar a un asistente) recién incorporado puede ayudar a los científicos 
de datos principiantes o no profesionales a aumentar su contribución y, por lo tanto, a ayudar a las 
empresas a ejecutar más iniciativas de ML sin poner en riesgo los proyectos de alto valor debido 

a un suministro limitado de talento de alto nivel. 


Aunque puedes utilizar el ML automatizado para agilizar el ajuste de los hiperparámetros, no es 

la única forma de hacerlo. Azure Machine Learning también proporciona un servicio de ajuste de 
hiperparámetros, que admite el muestreo de parámetros aleatorios, de cuadrícula y bayesianos. Solo 
tienes que configurar el experimento definiendo el espacio de búsqueda, especificando la métrica 
principal junto con cualquier política de terminación anticipada y asignando recursos. Cuando envías 
ese experimento, el servicio de ajuste de hiperparámetros se encarga de tareas cotidianas como la 
creación y el control de trabajos. Puedes visualizar el progreso de tus ejecuciones de entrenamientos 
utilizando el widget de bloc de notas que se proporciona en el SDK de Azure Machine Learning. 


En Experimentación con Azure Machine Learning se trata el ML automatizado, el servicio de ajuste 
de hiperparámetros y otras características relacionadas con la experimentación de machine learning. 
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Empaquetar el modelo 


Para poder implementar el modelo (o probarlo), deberás empaquetarlo para su entorno de 
ejecución de destino, lo que significa capturar todo lo que necesita para ejecutarse, incluidos los 
entornos Conda, las bibliotecas con versiones de Python y otras bibliotecas a las que hace referencia 
el modelo. Los contenedores son el estándar de facto para hacer esto; son la unidad de ejecución 
predeterminada en casi todos los entornos de inferencia. 


Cuando utilizas Azure Machine Learning para implementar un modelo, este se empaqueta en 
una imagen de Docker que contiene un servidor web para gestionar las solicitudes entrantes. 
Azure Machine Learning proporciona una imagen base de Docker predeterminada, por lo 
que no tienes que preocuparte de crear una a menos que quieras hacerlo. Puedes utilizar 

los entornos de Azure Machine Learning para seleccionar una imagen base específica. 


Uso de una imagen base de Docker personalizada 

También puedes utilizar una imagen base personalizada que proporciones. Normalmente, 
implementas un modelo con una imagen base de Docker personalizada cuando deseas utilizar 
Docker para administrar las dependencias, mantener un control más estricto sobre las versiones 

de los componentes o ahorrar tiempo durante la implementación. Por ejemplo, es posible que 
quieras estandarizar según una versión específica de Python, Conda u otro componente. O puede 
que quieras preinstalar el software que necesita tu modelo, especialmente cuando dicha instalación 
lleva mucho tiempo, de modo que no tengas que instalarlo por separado en cada implementación. 


ONNX 

Al empaquetar el modelo, puedes considerar el uso de Open Neural Network Exchange (ONNX), 
un formato abierto, como medio para maximizar el rendimiento durante la inferencia. El motivo 

es el siguiente: la optimización de los modelos de ML para la inferencia puede ser difícil porque 

es necesario ajustar el modelo y la biblioteca de inferencia para aprovechar al máximo las 
capacidades del hardware. El problema se complica cuando quieres optimizar para diferentes tipos 
de plataformas (cloud/perímetro, CPU/GPU, etc.), porque cada una tiene diferentes capacidades 

y características. La complejidad aumenta todavía más cuando se tienen modelos de diferentes 
marcos que deben ejecutarse en distintas plataformas, lo que provoca que se necesite mucho 
tiempo la optimización para las diferentes combinaciones. 


Con ONNX también puedes entrenar tu modelo una vez, en un entorno, con tu pila de herramientas 
preferidas, y, después, implementarlo en otro entorno para la inferencia y la predicción. Los modelos 
de muchos marcos (incluidos PyTorch, MXNet, Caffe2, TensorFlow, Core ML, scikit-learn, Keras, 
Chainer, MXNet, MATLAB y otros) se pueden exportar o convertir al formato estándar de ONNX. 


Cuando los modelos están en formato ONNX, se pueden ejecutar en numerosas plataformas 
y dispositivos. ONNX Runtime, un motor de inferencia de alto rendimiento para implementar 
modelos ONNX en producción, se ha optimizado tanto para el cloud como para el perímetro, 
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y funciona en Linux, Windows y Mac. Escrito en C++, también tiene API de C, Python y C#. ONNX 
Runtime proporciona soporte para la especificación ONNX-ML completa y también se integra con 
aceleradores en otro hardware, como TensorRT en las GPU de NVIDIA. 


ONNX Runtime se utiliza en servicios de Microsoft de gran escala como Bing, Office y Cognitive 
Services. Aunque las ganancias de rendimiento específicas que experimentarás dependen de una 
serie de factores, estos servicios de Microsoft, de media, han obtenido el doble de ganancia de 
rendimiento en las CPU. ONNX Runtime también se utiliza como parte del ML de Windows en 
centenares de millones de dispositivos. Por supuesto que también puedes usar ONNX Runtime con 
Azure Machine Learning, que permite enlaces en tiempo de ejecución y una portabilidad sencilla 

a los modelos de ONNX, así como beneficiarse de sus extensas optimizaciones, pruebas y mejoras 
continuas en el nivel de producción. 


Validar el modelo 


Después de empaquetar tu modelo, estará listo para probarlo. Como se empaqueta en un 
contenedor, la forma ideal de probarlo es con Azure Container Instances, que proporciona un 
mecanismo fácil y económico para la implementación de contenedores. Puedes realizar fácilmente 
la implementación en un contenedor ACI y efectuar la inferencia en él para probarla. De hecho, ni 
siquiera tendrás que crear un contenedor previamente, sino que se hará de forma automática como 
parte del proceso de implementación. 


Validación y generación de perfiles 

Con las capacidades de validación de modelos y generación de perfiles de Azure Machine 

Learning, puedes proporcionar consultas de entrada de muestra para garantizar que tu modelo 
funcionará según lo previsto cuando se implemente. Azure Machine Learning implementa y prueba 
automáticamente el modelo empaquetado en diferentes configuraciones de CPU/memoria de 
inferencia para determinar la configuración óptima que se usará cuando se implemente el modelo. 
La validación del modelo se realiza como parte de todo esto, utilizando los datos que se suministran 
para el proceso de generación de perfiles. 


Interpretabilidad del modelo 

A medida que pruebas el modelo, es posible que te preguntes por qué hizo las predicciones 

que hizo. Mediante el uso de los diversos paquetes de interpretabilidad del SDK de Python para 
Azure Machine Learning, puedes verificar hipótesis, validar que el comportamiento del modelo 
coincide con tus objetivos y comprobar si hay sesgos, todo lo cual puede contribuir, en última 
instancia, a consolidar la confianza con las partes interesadas. Con las clases y los métodos del SDK, 
puedes obtener valores de importancia tanto para las características sin procesar como para las 
diseñadas (los campos de datos que se usan para predecir un punto de datos de destino). Durante 
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el entrenamiento, puedes aplicar las clases y métodos de interpretabilidad para comprender 

el comportamiento global del modelo (se denominan "explicación global") o las predicciones 
específicas (se denominan "explicación local"). Las explicaciones también pueden implementarse 
junto con el modelo y utilizarse para la explicación local en el momento de la inferencia. 


Implementar el modelo 


Después de una ronda de validación exhaustiva, si todo parece bien, estarás listo para implementar 
tu modelo en producción. En este punto, tienes varias opciones: 


e Si quieres escala, flexibilidad y un registro y control exhaustivos, es recomendable que 
implemente Azure Kubernetes Services, que se pueden dimensionar según tus necesidades. 


e Si tus modelos son pequeños y estás seguro de que no necesitarás ampliarlos, puedes 


implementarlos en Azure Container Instance, que también proporciona una amplia supervisión 
y registro. 


e Si utilizas Azure loT Edge, puedes implementar módulos de loT Edge directamente en 
dispositivos de loT basados en Linux. 


e Sila inferencia del rendimiento es fundamental, puedes implementar matrices de puertas 
programables (FPGA) en Azure; se trata de la mayor inversión en cloud del mundo. Sin embargo, 


antes de planificar hacerlo, debes verificar que se admita tu caso de uso específico. 


También puedes efectuar la implementación en otros entornos, incluyendo GPU, Azure App Service 
y máquinas virtuales de bloc de notas. Si tienes un modelo existente que se ha entrenado en otro 


lugar, puedes seguir utilizando Azure Machine Learning para implementarlo. 


Supervisar el modelo 


Después de que el modelo se haya implementado, debes supervisarlo, como medio para conocer 
qué datos se envían a tu modelo, las predicciones que devuelve y, en última instancia, cómo se está 
utilizando. También es recomendable que supervises el cambio de los datos para saber si tu modelo 
se debe reentrenar y cuándo se debe hacer. 


Para ello, necesitarás capturar y analizar una gran cantidad de métricas, lo que puedes hacer 

si habilitas la recopilación de datos. Los datos recopilados se almacenan en Azure Blob Storage, 
lo que facilita la validación y el análisis con las herramientas que prefieras. También puedes hacer 
que Azure Machine Learning supervise el cambio de los datos, que es uno de los principales 
motivos por los que la precisión del modelo se deteriora con el tiempo, y recibir una alerta por 
correo electrónico cuando se detecte esta situación. Por último, puedes utilizar Azure Application 
Insights con Azure Machine Learning como un medio para supervisar las tasas de solicitudes, 


las tasas de dependencias, los tiempos de respuesta, las tasas de errores y mucho más. 
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Reentrenamiento continuo 


Con el tiempo, es posible que tengas que reentrenar el modelo para mejorar su precisión, 
rendimiento o ambos factores. Lo ideal es que este proceso de Cl/CD sea totalmente automatizado. 
Al usar la extensión de Azure DevOps para Azure Machine Learning, puedes ver tanto el registro de 
modelos de Azure Machine Learning como el repositorio GitHub que contiene tus blocs de notas 

y scripts de Python y, después, activar Azure Pipelines que automáticamente reentrena y redistribuye 
tu modelo basándose en nuevas confirmaciones de código o cuando se registran nuevas versiones 
de un modelo. 


Dichas capacidades pueden ser sumamente eficaces. Permiten a los equipos de ciencias de datos 
configurar las etapas para crear y lanzar canalizaciones en Azure DevOps para sus modelos 

de ML, y así automatizar totalmente el proceso. Además, como Azure DevOps es el entorno 

que se utiliza para administrar los ciclos de vida de las aplicaciones, hemos cerrado el círculo 

al permitir que los equipos de ciencias de datos y los equipos de desarrollo de aplicaciones 
colaboren sin problemas y activen nuevas versiones de aplicaciones dotadas de ML en el entorno 
de DevOps siempre que se cumplan ciertas condiciones durante el ciclo de vida de MLOps. 


Resumen 


Con Azure Machine Learning tendrás todo lo que necesitas para implementar un 
enfoque integral de MLOPS, incluida la capacidad de realizar el seguimiento y crear 
versiones de todos los activos en el ciclo de vida del modelo de ML, además de auditarlo 
y reutilizarlos. También tendrás los medios para racionalizar y automatizar ese ciclo de 
forma integral y de vincularlo a los procesos DevOps existentes, por lo que los científicos 
de datos, los ingenieros de ML y los desarrolladores de aplicaciones puedan colaborar 

y trabajar con la misma cadencia en la entrega de aplicaciones dotadas de ML. 


Colaboración Crear aplicación Probar aplicación Lanzar aplicación Supervisar aplicación 
Desarrollador . A 
Entrenar modelo Validar modelo Implementar modelo Supervisar modelo 


de aplicaciones 
con Azure DevOps 


i { j 2 Extensión AzureMachine Learning para Azure DevOps 


Científico de datos con 


Azure Machine Learning Conservar modelo 


Auditar la gestión de formaciones e interpretación del modelo 


Figura 4. Azure Machine Learning proporciona a los científicos de datos y a los ingenieros de ML herramientas 
sofisticadas y prácticas optimizadas, igual que los desarrolladores que trabajan en un entorno de DevOps. 
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Por sí solas, muchas de las características y capacidades que hemos analizado pueden parecer 
lógicas e intuitivas. Sin embargo, hasta ahora nadie ha sido capaz de reunirlo todo de manera que 
funcione para todos los involucrados, lo que les permite ser inmensamente más productivos. 


Si estás listo para probar Azure Machine Learning por tu cuenta, solo tienes que ir a Empezar a usar 
y te guiaremos por el proceso, incluida la forma de registrarte en una prueba gratuita. O, si todavía 
no estás listo, aquí tienes otros recursos: 


e Obtén más información acerca de Azure Machine Learning. 
e Consulta el repositorio de MLOps del servicio Azure Machine Learning en GitHub. 
e Vela sesión de Microsoft Build 2019 en MLOps. 
e Vela sesión de Microsoft Ignite 2019 en MLOps. 
e Descarga nuestros e-books gratuitos: 
o Principios de la ciencia de los datos 
o Machine learning reflexivo con Python 
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Empezar a usar 
Azure Machine 
Learning 


Hemos tratado brevemente varios conceptos clave de 
Azure Machine Learning en esta guía, incluidas sugerencias 
para la documentación completa online de cada uno de 
ellos. Si quieres leer sobre un tema que no hayas tratado, 
puedes encontrar el conjunto completo de artículos 

online; encontrarás el primero aquí, con el resto de ellos 
inmediatamente debajo de él en el panel de navegación. 
Como mínimo, antes de comenzar, es recomendable 


que consultes la información genera 
Machine Learning y su modelo de flujo o de trabajo. 
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Tutoriales paso a paso 


¿Listo para ir a uno de nuestros tutoriales? Si aún no tienes una suscripción a Azure, puedes crear una 
cuenta gratuita antes de empezar. 


Como primer paso, es recomendable que pruebes a usar el SDK de Python para crear tu primer 
experimento mediante la configuración de un espacio de trabajo y un entorno de desarrollo 

y, después, el entrenamiento de tu primer modelo. O prueba uno de nuestros tutoriales del SDK 
de Python: 


* Entrenar un modelo simple de clasificación de imágenes de regresión logística y, a continuación, 
implementarlo. 


e Utilizar el machine learning automatizado para crear un modelo de regresión. 


e Puntuar por lotes un modelo de clasificación con el SDK de Python y las canalizaciones. 

Si prefieres empezar con la interfaz visual, puedes consultar los tutoriales para usarla para entrenar 
un modelo de regresión y, a continuación, implementarlo. O prueba a crear un experimento de 
machine learning automatizado desde la página de destino del espacio de trabajo, todo ello sin 
escribir una sola línea de código. 


Ejemplos 


También tenemos una gran cantidad de ejemplos de código basados en el SDK de Python para 
ayudarte a ponerte al día. Si has completado el tutorial de configuración del entorno y el espacio de 
trabajo mencionado anteriormente, ya tendrás un servidor de blocs de notas dedicado y precargado 
con el SDK y el repositorio de muestra. Si prefieres usar tu propio servidor de blocs de notas para 

el desarrollo local u obtener muestras en la máquina virtual de ciencias de datos, una imagen de 
máquina virtual personalizada para ciencia de datos, necesitarás algunos pasos adicionales. 


Guías de procedimientos 


Después de completar algunos tutoriales y experimentos de muestra, estarás listo para empezar 

a explorar todo lo que puedes hacer con Azure Machine Learning por tu cuenta. Nuestras guías de 
procedimientos online pueden guiarte por muchas de las cosas que debes hacer. Hay demasiadas 
para enumerarlas en este documento, pero puedes encontrar la primera aquí y el resto se enumeran 
inmediatamente debajo de ella en el panel de navegación. 


Referencias 


Por último, si necesitas materiales de referencia, consulta nuestra documentación sobre SDK de 
Azure Machine Learning para Python y CLI de Azure Machine Learning. También hay un conjunto 
completo de materiales de referencia en los módulos de interfaz visual; de nuevo, consulta el panel 
de navegación para ver la lista completa. 


